首页> 外文OA文献 >SharesSkew: An Algorithm to Handle Skew for Joins in MapReduce
【2h】

SharesSkew: An Algorithm to Handle Skew for Joins in MapReduce

机译:sharesskew:一种处理mapReduce中连接偏斜的算法

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

In this paper, we investigate the problem of computing a multiway join in oneround of MapReduce when the data may be skewed. We optimize on communicationcost, i.e., the amount of data that is transferred from the mappers to thereducers. We identify join attributes values that appear very frequently, HeavyHitters (HH). We distribute HH valued records to reducers avoiding skew byusing an adaptation of the Shares~\cite{AfUl} algorithm to achieve minimumcommunication cost. Our algorithm is implemented for experimentation and isoffered as open source software. Furthermore, we investigate a class ofmultiway joins for which a simpler variant of the algorithm can handle skew. Weoffer closed forms for computing the parameters of the algorithm for chain andsymmetric joins.
机译:在本文中,我们研究了当数据可能偏斜时,在MapReduce的一个回合中计算多路联接的问题。我们优化了通信成本,即从映射器传输到诱使器的数据量。我们确定频繁出现的联接属性值HeavyHitters(HH)。我们通过使用Shares〜\ cite {AfUl}算法的改编来将HH有价值的记录分发给归约方,从而避免偏斜,以实现最低的通信成本。我们的算法是为实验而实现的,并作为开源软件提供。此外,我们研究了一类多路联接,对于该联接,该算法的较简单变体可以处理偏斜。 Weoffer封闭形式用于计算链和对称联接的算法参数。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号